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核实 数据 下 单 指标 EV 模型 的 经 验 似 然 推 断 * 


刘 强 !， Be BR? 
(1- 首都 经 济 贸易 大 学 统计 学 院 ， 北 京 100070; 2- 北京 工业 大 学 应 用 数理 学 院 ， 北 京 100124) 
摘 要: 对 于 单 指标 EV 模型 ， 当 解释 变量 带 有 测量 误差 ， 尤 其 是 替代 变量 和 解释 变量 的 关系 不 能 确定 
时 ， 单 指标 模型 的 估计 就 会 出 现 维 数 灾 祸 问 题 。 本 文 提出 了 一 种 降 维 方法 ， 有 效 解 决 了 上 述 问 
题 ， 并 利用 经 验 似 然 方法 给 出 了 未 知 参数 的 置信 域 。 由 于 采用 降 维 技术 ， 因 而 所 得 结果 在 生物 工 
程 、 网 络 工程 等 领域 的 数据 处 理 中 具有 较 好 的 应 用 价值 。 
关键 词 : 单 指标 EV 模型， 经验 似 然 ， 核 实数 据 ; 降 维 
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1 引言 
考虑 如 下 单 指标 模型 
Y =g(6 X) +e, (1) 


其 中 9(.) 为 未 知 的 一 元 联系 函数 ，X 为 有 2 上 的 随机 向 量 ，Bo 为 px1 的 未 知 参 数 ， 且 有 jj6o| = 
1， 这 里 :表示 向 量 的 Euclidean 模 。e 为 模型 误差 。 在 生物 工程 等 领域 中 的 数据 处 理 中 ， 经 
常 遇 到 所 谓 的 “ 维 数 灾祸 ”问题 ， 由 于 单 指标 模型 通过 对 BEX 而 不 是 苹 回 归 ， 有 效 地 避免 了 
上 述 问 题 ， 因 而 该 模型 在 实际 问题 中 具有 广泛 的 应 用 前 景 。 关 于 上 述 模型 ， 已 有 不 少 的 文献 讨 
i, Xue 和 Zhu! 利用 经 验 似 然 的 方法 给 出 了 未 知 参数 8 的 经 验 似 然 置信 域 。 

在 实际 应 用 中 ， 解 释 变 量 X 的 精确 值 往 往 很 难得 到 ， 或 者 时 间 消 耗 太 多 ， 或 者 代价 太 高 ， 
这 时 直接 观测 的 是 带 有 测量 误差 的 替代 变量 闷 而 不 是 真实 变量 于。 通常 把 变量 带 有 测量 误 
差 的 模型 称 为 EV (errors-in-variables) 模型。 一 般 而 言 ， 替 代 变 量 夸 和 真实 变量 和 之 间 的 关 
系 往往 比较 复杂 ， 例 如 瑟 = %(X,s)， 其 中 es 为 测量 误差 ，W%(.) 为 一 个 任意 的 已 知 函 数 。 在 这 
种 情况 下 ， 要 对 未 知 参数 Bo 进行 有 效 的 推断 往往 是 比较 困难 的 ， 然 而 利用 核实 数据 可 以 很 
好 地 克服 这 一 困难 。 基 于 替代 数据 和 核实 样本 的 推断 已 经 引起 了 众多 统计 学 者 的 重视 。 例 
如 Sepanski 和 LeeDl 研究 了 基于 核实 数据 的 非 线性 EV #2. Wang, Wang All Raol®l 分 别 
讨论 了 基于 核实 数据 下 线性 EV 模型 ， 部 分 线性 EV 模型 以 及 半 参 数 条 件 密度 函数 中 的 参数 估 
计 问 题 。Stute et alll 利用 核实 数据 讨论 了 非 线 性 EV 模型 的 经 验 似 然 推断 问题 。 

本 文通 过 利用 核实 数据 ， 构 造 了 未 知 参 数 的 两 种 经 验 对 数 似 然 比 统计 量 ， 即 估计 的 经 验 
对 数 似 然 比 统 计量 和 调整 的 经 验 对 数 似 然 比 统计 量 。 证 明了 所 构造 的 经 验 似 然 比 统计 量 渐 近 
Fy? 分 布 ， 所 得 结果 可 以 用 来 构造 未 知 参数 的 置信 域 。 

收 稿 有 日期: 2008-03-10. 作者 简介 : 刘强 (1976 年 9 月 生 ), 男 , 博士 , 副教授 . 研究 方向 : 非 参 数 统计 与 金融 数据 分 析 . 
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2 ”方法 与 主要 结果 


(sz E(e|X,X)=0. HFI) 未知 ， 要 估计 po， 首先 需要 给 出 9(.) 的 估计 。 假 定 主要 数 
HL(V;, X)N {JENA PEA, Bg iid OSE (YX), XN) 相互 独立 。 为 了 
模型 (1) 的 可 识别 性 ， 可 以 采用 Xue M Zhu 中 “去 一 分 量 ”的 方法 。 记 B S (B bp) 
不 妨 假定 fo 的 第 p 个 分 量 B HIE, BMWS b, = -1 - lB. FR 


Bo = (87, (1 — ||All?)*/2)”. 


因而 对 Bo 的 推断 可 以 转化 为 对 p — 1 HEAR o 的 推断 。 
首先 ， 利 用 局 部 线性 光滑 的 方法 给 出 未 知 函数 g(.) A g (-) 的 估计 。 对 于 任何 B, g(-) A g'(-) 1 
估计 通过 最 小 化 下 式 给 出 。 


N+n T 
2 Boy X; —t 
A ee kK, (74), (2) 


其 中 Ki(-) 为 核 函数 ，h, 为 窗 宽 。 记 6 和 8 为 加 权 最 小 二 乘 问题 (2) 的 解 。 未 知 函 数 g(-) A g'(-) 
的 估计 定义 为 9(t;B) = & 和 9(t; p) = 2， 经 过 简单 计算 有 


N+n N+n SEN 
It) = D Wnilt BY Fe) = J, Walt: 8M, 
i=N+1 i=N+1 
这 里 
Nin 
Wnilt; B) = Unilt; By hn)f > Ung(tiB, han), 
j=N+1 
5 
Wnilt; Bb) = Uni( (t; B, hin)/ > Un; (65 B, hin), 
j=N+1 


Ty. _ 
Uni(t; B, hin) = hi K (FEEN (af X; — [Sm2lt; B, han) ~ (83 Xi — t) Sna (tB hin) 


Tni(t; B, hin) = h Kı (Be —*) (68 x: -= t)[(87 Xi — t)Sn,o(ts B, hin) — Sn,1(t; B, hin)], 
Sn(t)B, hin) =n hz 5 (07 X: —t) Ki Ce 1 =0,1,2. 
i=N+1 in 
为 了 使 用 主要 数据 中 的 替代 变量 筷 ， 使 得 了 和 闷 相 关 ， 我 们 将 模型 (1) 等 价 地 转换 为 
Y = m(X,#) +n, (3) 


其 中 
m(@, 8) = E[g(G2X)|X =F], n=e+g9(GEX) - E[9(03 X)| J]. 


id Ja = 080/08, Mitt 


m™ (Z, 8) 全 aan.) = E[ JgXg/(65 X) | X =). 
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构造 辅助 随机 向 量 
Zi(B) = (Y; 去 m(Xi, B)) mY (Xi, B), 


ERS) EZ = O4BR4ACGABER, MUNK 8 是 否 为 真实 参数 的 问题 就 转化 为 检验 是 
GA SHR EZG) = 0 对 任意 的 i = 1,2,… ,NN 成 立 。 因 此， 利用 信息 EZ = 0， 我 们 提出 
对 数 经 验 似 然 比 函数 


N 
1(8) 全 局 (8) = —2max { > log( Nps) 
i=1 


N N 
pi>0, Dp=1, az=} A 
i=l i=1 


TAEK, “BARBS, 16) HHI A HRA Dp 一 1 的 标准 -长 方 分 布 x2_1。 然 
而 1(6) 不 能 直接 用 于 68 的 推断 问题 ， 原 因 是 1(6) 中 含有 未 知 函 数 m( 苹 ,B)，m 人 了 站 ( 交 ,B)。 为 
此 我 们 需要 给 出 两 个 未 知 函 数 的 估计 。 一 个 自然 的 方法 是 利用 高 维 核 估计 给 出 上 述 函 数 的 估 
计 ， 然 而 在 非 参 数 回归 估计 中 ， 这 一 推断 需要 较 大 的 核实 数据 才能 达到 合适 的 精度 。 受 王 启 华 
和 Hairdleb] 的 启发 ， 因 而 我 们 提出 了 如 下 降 维 方法 。 假 设 


m(X, B) = ula? X, 8), 
其 中 以) 为 未 知 函 数 ，a 为 未 知 参数 。 这 一 假设 的 合理 性 可 以 参见 王 启 华 和 Härdle, A 
T m(Z, 6) 的 估计 可 以 定义 为 
a KA 2) (AF x;) 
SONY Ka (RD ) 

这 里 Ko(-) 为 核 函 数 ，hzn 为 收敛 于 0 的 窗 宽 。 然 而 上 述 估计 中 的 a 和 g(-) 未 知 ， 不 能 直接 用 来 
估计 函数 m(%, 8)。 为 解决 这 个 问题 ， 一 个 自然 的 办 法 就 是 利用 a 和 g(-) 的 相合 估计 来 替代 。 

注意 到 Elg(87X)|X] = E[Y|X]， 由 Zhu 和 Fangl8， 可 以 利用 切片 逆 回 妇 核 方法 给 出 a 的 
估计 。 定 义 


Š =(%,---,X,)7, RV) = (应 (了 ,BY)) = (EIÑ: 1Y], E[Xp Y)", 


JASAR REB X, i = NN 十 1,… ,NN 十 n 表 示 芝 的 n 个 独立 复制 ，Xij X 的 第 了 个 
分 量 ，7 = 1,… ,p。 记 


N+n 
ioe 5 Zak ( 15), j=1,--,p, 
7 nhon i=N41 7 han 


7 1 N+n -Y 
fn,r (Y) = "PR > Ky( 


i=N++1l 
这 里 K) 为 核 函数 ，Pan 为 窗 宽 。 设 {vw} 为 某 个 正 的 常数 列 ， 记 
fony (y) = max{ fry (y), Vn}; Jin(y) = Jin (y)/fon,y (U), 
N+n 1 N+n 1 N+n T 


åns 》 nn- (E E mG E Pa) 


j=N+1 j=N+1 j=N+1 
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Bon 为 对 应 于 Ân 的 最 大 特征 值 的 特征 根 ， 从 而 an 可 以 作为 a 的 相合 估计 。 记 


> N+n T X. _< 
in) = Yo o(a), 


" j=N+1 
N-+n TiS ~ 
1 an (X; — £) 
fr(Z) = ky (2 }. 
nhon T ( hon ) 


记 fon(Z) = max{ fn(Z),bn}> FEF {bn} WENERA SA. AT m(Z, 6) 的 截 尾 估计 为 


Fon) z) 
将 (5) 式 中 含有 的 9(B8X;) A Ja Xid (OT X) TARR mO (E, B) 的 估计 次 (00(2 B). 
若 记 


th(Z, p) = 


Z,(8) = (Yi — (Xi, B)) mm (Xi, B), 
XB a) (Xj, B) A Xi B) Xt BAF, WE LAKE AIGA Ee 


(B) si( B) = -2mox{ Sloe Np») ) | pi >0, > =1, Dn = o}. (6) 


利用 Lagrange 乘 数 法 ，Pi 的 最 优 值 为 m = NN-1(1 + 》XT 甸 (8))-1， 其 中 入 为 下 述 方程 的 解 。 


pe Z(8)  _ 
yo 14 ATZ, (8) = (7) 
从 而 
a N A 
iB) =2 > log(1 + A7Z;()). (8) 
i=1 
设 


Vo(8) = E[(¥ — m(X, B)? mO (X, B)mOT(X, p), 
V(8) = Vo(B) + yB[(m(X, B) ~ 9( 63 X)? mO (X, B)m7(X, By), 


其 中 7Y = lim 立 。 为 了 记号 简洁 ， 我 们 用 mOT(X, 6) 表示 m)(X, 6) 的 转 置 。 与 标准 的 经 
验 似 然 对 数 函 数 不 同 ， HY Z;(8) (i = 1,2,… ,n) 不 是 ii.d.， 因 而 i(B) 的 浙 近 分 布 不 是 标 
HE x7_1 分 布 。 

定理 2.1 若 满 足 第 三 节 中 的 条 件 C， 当 6 为 真 参 数 时 ， 则 有 


个 L 
/(O) — wX? 十 waX? 2 Baas wp-1X1 p_1 ; 


其 中 “ =,” 表示 依 分 布 收敛 ， Wi wa ,Wp1 AV *(B)V (8) 的 特征 值 ， xi, oX, De pp 
为 相互 独立 的 自由 度 为 1 的 标准 x? 随机 变量 。 
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为 了 应 用 定理 2.1 构 造 8 的 置信 域 ， 需 要 给 出 未 知 权重 wi 的 相合 估计 。 记 


N 
B) = NY (Y: — (Xi, B) MO (Xi, Bm YT (Xi, B), 


i=1 
. a N N+n es ; 本 = 
V(B) = Vo(8) + D (Ka B) -HABE KI) mY (Xj, BHO? (Xj, 8). 
j=N+1 


ch wk AT DA HE tH V1 (8)V (6) EO: TU Ew MAA Hit, Kb BARK) 而 得 
SURESH URINE W. LBL EEA E O Ta al Pdi a 
DX? a 十 … 十 Oo。 R, WHORL- a 分 位 点 ， 则 B 的 渐 近 覆盖 概率 
为 1 一 a 的 置信 域 为 
1.(8) = {8 : 16) < a}. (9) 
事实 上 ， 可 以 使 用 Monte Carlo 模 拟 方法 从 xi 分布 中 分 别 产 生 独 立 样本 XZ 1,X?2,… ,X3,p_1 而 
得 到 条 件 分 布 鼠 (.)。 
利用 定理 2.1 构造 8 的 置信 域 需要 估计 权重 wi, 这 样 会 降低 置信 域 的 精度 .按照 Rao 和 Scott 
的 结果 ， 可 以 推出 
AO >》 win? 
i=l 


的 分 布 浙 近 于 一 个 自由 度 为 p 一 1 的 x? 分 布 ， 这 里 多 8) = (p 一 1)/tr{W1(B8)V(B8)}。 然 而 这 种 
遂 近 仍然 依赖 天 wi， 下 面 给 出 一 个 调整 的 经 验 对 数 似 然 比 。 注 意 到 


tr{V -1(8)V (6)} 


A) = DVO) 


检查 ;6) 的 渐 近 表达 式 ， 在 多 8) 中 用 
. N “3 N 了 T 
B(8) = {0 218) }{ ZH} ， 
i=1 i=1 
替代 立 (6)， 从 而 得 到 一 个 新 的 调整 因子 p(8)。 由 此 定义 调整 的 对 数 经 验 似 然 比 (AEL) 


ie(6) = ABCO). (10) 


定理 2.2， 若 满足 第 三 节 中 的 条 件 C， 当 有 为 真 参数 时 ， 则 六 ez(B) > xi. 
根据 定理 2.2， 可 以 构造 的 1- a 置 信 域 


fag,a(B) = {B : baa(B) < ĉa}. (11) 


3 ”定理 的 证 阴 


设 c 表 示 不 依赖 于 n MN 的 正 的 常数 ， 在 不 同 的 地 方 可 以 表示 不 向 的 值 。 设 HM? 是 R? 上 
A 对 任何 的 p 维 向 量 a， 设 as 表 示 a 的 第 s 个 分 
fr, s=1,2,- 


为 了 得 到 人 (8) 的 源 近 分 布 ， 需要 如 下 条 件 。 
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条 件 C 下列 条 件 统称 为 条 件 C。 
Cl TX RRB f(t) ET LWA 1M Lipchitz RHF, KET = {t = Pz : x € A} 
其 中 4 为 六 的 有 界 支撑 集合 ; 


i < 7 
0< inf f(t) < sup f(t) < oo 


C2 (I) glt) E M?. 
(II) sup; E[9?(GoX) | X =7]< œ, supz Elg'(BoX)? |X =F] < oo. 
C3 (D 核 Ki(w) 是 一 个 有 界 且 对 称 的 概率 密度 函数 ， 且 满足 


ION #0, fK < 00. 


(Il) K2(w) 为 可 导 的 具有 有 界 支撑 的 2 阶 核 函 数 。 
(IID K3(-) 为 对 称 的 具有 有 界 支撑 [-1,1] 的 核 函 数 ， 且 满足 


fixou =0, [eka =0, i=1,2,3. 


C4 (I) m(ž,8) E M?, MPE, B) E M?, s=1,2,---,p—1. 
(II) sup; E[m?(z, B)] < oo， sup; E [mP (Z, B)?] < 00. 


C5 蕊 的 密度 函数 f(z) € a, H 


lim sup nP{ fz (Z) < bn} < œ. 
n= 


C6 (I) sup E (e? |X =) < oo; 
(II) E(X4) < co; sup; E(X4| X = %) < 00; sup; E(Y?] XŠ =%) < oo. 
C7 (I) nh honb2 — œ, h?,b57hz,, — 0, nh3,,b4 — 00, nh$,b5? — 0. 
(Il) 对 满足 1/8+ c2/4 < cl < 1/4 一 cz 的 正 数 c1, cz 和 7m 一 co， 有 jhan 一 mc In ~ 
2- ， 这 里 ~ 表示 等 价 的 两 个 量 。 
C8 ihi(y) = Rily)fr(y), i = 4-… ,Pp。hi(y)，fy(y)3 阶 可 微 且 满足 存在 原点 的 某 个 
领域 Zi 和 c > 0， 对 于 任意 的 ve Ui 有 


|f sOy +u) - £2 (y)| < clul; jay +u) 一 hl (y)| < clul. 
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对 任意 的 1<i, jp 和 we 有 
|Ri(y + u)Rj(y + u) — Ri(y)R;(y)| < clul. 


Co 对 任意 的 1 <i, j <p, JnERA(Y)R(Y)I(fy(Y) < wn) =o0(1), HP I(-) 为 示 性 

C10 V8) 为 一 正定 矩阵 。 

C11 y=lim&. HP y> 0 为 常数 。 

$: 条 件 C1-C3 是 为 了 获取 $ 一 g = O,(h?2, 十 (nhin)-3)， 条 件 Cl EBA F OMO 的 
分 母 以 高 的 概率 偏离 0， 条 件 C2 的 使 用 原因 是 在 估计 9(.) 时 使 用 了 2 阶 的 核 。 条 件 C3 保 
UE 6(-) A g’(-) ARPS FE 具体 见 文献 [1,10]; 条 件 C4-C5、C7() 是 处 理 核 实数 据 问题 
的 基本 条 件 ， 条 件 C5 ER EM X REAR 闵 ( 裤 的 尾巴 进行 控制 ， 和 否则 会 给 理论 证 明 带 
米 一 定 的 困难 ， 见 文献 [3, 身 和 文献 0];， 条件 C6(IT)、C7(IT) 和 C8-C9 是 为 了 获取 an -a = 
Op(n-)， 条 件 C8 主要 用 于 给 出 Y 的 密度 函数 的 光滑 度 ， 条 件 C7(IT) 和 C8-C9 已 被 王 启 华 
All Hardle!”! 与 Zhu 和 Fangtl 使 用 。 其 余 条 件 是 标准 的 。 

我 们 把 定理 证 明 的 主要 步骤 分 成 下 面 几 个 引 理 。 

31100 车 条 件 C1-C3 成 立 ， 如 果 hin = cn-~", 0 < a < 1/2, c > 0， 则 对 于 任何 的 正 
整数 r>2, N+1<i<N+n， 有 


N+n 


E|| So Was 65 Xs DIOT Xs) — 9(G5X:)|" | = ora), 
j=N+1 
N+n fe k 
a | DO Wns (60 Xi;B)g(B8 X) — 9 (89 Xi) | = O(hin). 
j=N+1 


引 理 209] 在 引 理 1 的 条 件 下 ， 对 于 任何 的 正 整数 r+ >2, N+1<i<Nin, 有 


E | |Wns( 8 XB) | = O((nin)"), 


> [Was(B8 Xi P) | ] = O((nhin)?“*), 
N+1,jžżi 


[Iw 
Hi 
[| 
> 


E | | Wi(B8 Xi; PN | = O((nhin)~) + O((nPAE,)-"?), 
D 
E |W Wns (Bo Xi; p) | ]=o (n hiz”). 
j=N+1,j 4% 


引 理 3 在 引 理 1 的 条 件 下 ， 对 任意 的 +T1<i<N+mz， 有 


E [9(63 Xi; 8) — 9(62 X:) = Olha) + O((nhin)™’), (12) 


E [0 (8E Xi; B) ~ 9' (BE Xi)] = Ohn) + O((nh3,)?). (13) 
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证 明 根据 引 理 1 和 引 理 2， 有 


E [ôE Xi 8) — (PT Xi)]’ 


-= N+n 2 N+n 2 
= E| So Was OF XisB)9(68 Xi) - (AEX) | +E] S Waiti Xi Pe] 
j=N+41 j=N+1 
N+n 
< chi, +c > E [W2 (0 Xi 6)] < chi, + c(nhin)™. 
j=N+1 


(12) 式 得 证 ， 类 似 可 以 证 明 (13) 式 。 
引 理 4 车 条 件 C 成 立 ， 对 任意 的 1<i<N， 有 


(i) E [Ri b) - mX: 8)? | Xi] 
< ¢(nhonb2)-} + ch$,,b5? + cI [fg (Ñi) < 2bn] + (ht by han) + c(nhinbzhan)™', 
(i) E [ (mY) (Xi, B) — mM (Xi, 6)? | Xi] 
< c(nhonb2)-! + ch3,,b2? + cl | fz (Xi) < 2bn] + c(h2, bi? hz) + c(nh§, be hon). 
证 明 (i) 5 (ii) WEAR, (MSG (i) FUE. Be 


fon(-) = max (fz(-), bn); Mon(-) = Sees 
MIT, 6) BA a BR MT, p) Han 得 到 的 ， 则 有 
E [ (men (Xi, B) — m(Xi, B))? | Xi] 


_ £x(Xi) 


Ha) |] < el { fz(Xi) < bn}. 


=E [ m?(Xi, 8) (1 
下 面 仅 需 证 明 
E [ (MXi, b) — mon(Xi, B))? | Xi] 
< c(nh2nb2)-! + ch4 b=? +cI [fx (Xi) < 2bn} + c(h4 bz hz) + c(nhinb2han)', (14) 
对 任意 的 i = 1,2,… ,和 成 立即 可 。 记 


test a, thine ee ~ al (X; - 2) 


~ dy ee me S al (X; —Z) 
Foal) = Si Oe, URNA m(#,6)|Ko(F2—*"), 
a al (X; -F 
mE = ee Ye [AEX — 583) j(Z% 2), 


Jan (2) = [fn(F)fon(F) — fin (E) fz (E) ]m(E, B)/ [ fon (@) fon (2) ]. 


第 2 其 刘强 ， 薛 留 根 ， 核 实数 据 下 单 指标 EV 模型 的 经 验 似 然 推断 
id T,(Z) = (F, B) — mon(F, 8), WH 

Tn(@) = [ Jan(€) + Jen (F) + Jan ($) ]/Ên (E) + Jan(#) + [mF B) — ME, B). 
从 而 对 于 任意 的 i = 1,2,… ,N， 有 

E [T}(X:) | Xi] < 4b22E [TKi) | Xi] + 4657B [J2 (X:) | Xi] 
+4b;,7E [ J3,(Xi) | Xi] + 4B [ J2,(Xi) | Xi] 
E[(m(Xi, b) — MXi B))? | Xi]. 

经 过 简单 计算 ， 对 于 任意 的 ? = 1,2,……,N， 有 


E [JR (i) | Xi] < enha), E [ J2,(Xi) | Xi] < ec(nhg,,)-! + chë. 


E [ J2,(Xi) | Xi] < ch ha?br? + c(nhinhg, b2). 
E [ J2,(Xi) | Xi] < cl {fz (Xi) < 2bn} + e(nhB,,b2) 7} + chdkor?. 
fH Zhu #0 Fang!) 可 知 ，an — a = Op(n-1/2)， 经 过 一 系列 复杂 运算 ， 可 以 证 明 
E [ (MXi, B) —m(Xi, 8)? | Xi] < e(mhanbh)~* + chgnba?. 
结合 (15)-(18) 即 可 证 明 (14) st. 
引 理 5 在 定理 2.1 的 条 件 下 ， 若 6 为 真实 参数 ， 则 有 


N 
N35,%(8) = N(O,V(8)). 


i=l 


证 明 经 过 一 系列 复杂 运算 , 可 以 证 明 


N N+n 
SLAO = mFS [Ky - 9X5, 8) ]n(K, 8) 
i=l j=N+1 


N 
+N? mY (Xi, B) [Yi — m(Xi, 8)] + op(1). 


i=1 


从 而 引 理 5 得 证 。 
引 理 6 定理 2.1 的 条 件 下 ， 若 6 为 真实 参数 ， 则 有 


N 
D2(8)27 (8) £ vop), 
i=1 


其 中 Vo(B) 的 定义 见 定理 2.1。 
证 明 记 


Rn (Yi, Xi; 8) = [m(Xi, B) = (Ki, B)]m™ (Xj, B) + ¥;[m (Xi, B) = m® (Xi, B)], 


(15) 


(16) 
(17) 


(18) 
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则 有 


eee eas 
地 2 2927 (8) 

i=1 

2 ay (1 1 x. . 
= yam (Xi, 8)m™ (Ka P) + Hy 2o RalYi, Xi PRA (Ya Xi) 

1 Š = > en = z 

+57 2 Ra lYi, Xs Pm? (Xi, 6) + HD mim (Xi, p)Ra (Yi, Xi; B) 
i=l i=1 


4 
全 YA: 
{=i 


利用 大 数 定律 得 Al -WW(8)。 由 引 理 4 及 标准 的 讨论 可 以 证 明 Ai > 0, i= 2,3,4。 从 而 引 
理 6 得 证 。 
引 理 7 在 定理 2.1 的 条 件 下 ， 若 6 为 真实 参数 ， 则 有 


max, ||Z:(8)l| = op(N*). 


证 明 E Êl) A Z,(B) KH s (s =1,2,--- ,p—1) 44, 


Bay |i (P| < ma Inm P(X; B)| + es | [m(X;, b) — riu( Xi, Pm (Xi, B)| 


+ max | [mP (Ki, B) — mM (Xi, 8)] nil 


+ rete | [m(Xi, p) = m(Xi, A)| [mP (Xi, B) = D(X, D)] | 


l> 


Bj. 


i=1 
由 文献 [1 中 引 理 3 可 知 ， 若 EY? < co， 则 
max |Y;]/ vn = 0. 


1<i<n 


eh BE AY A Emm (Xp) < coo， 从 而 有 Bi = op(N3)。 利 用 Markov 不 等 式 ， 结 合 引 
理 4， 对 于 任意 的 5 > 0， 可 以 证 明 


N 
P(N-¥?By > 8) < > P(|[m(Xi, 8) - 0R, BMP, B) > SVN) 


N 
sae El lem, 8) -mT Pm (KP) — 0. 
i=l 


Mii Bo = op(N3)。 类 似 地 可 以 证 明 


B3 = o(N3), B4 = 0p(N?). 
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引 理 7 得 证 。 
引 理 8 在 定理 2.1 的 条 件 下 ， 若 为 真 参数 ， 有 入 = Op(N- 引 )。 
证 明 由 引 理 5， 可 以 推出 


N 
NY Z;(8) = Op(n-*). 
i=1 


ch ESR AIS1|#E6, AH Owent! 中 (1.14) 式 相同 的 论证 方法 可 以 证 明 引 理 8。 
定理 2.1 的 证 明 在 (8) 式 中 利用 Taylor 展 开 ， 并 结合 引 理 6-8， 有 


N 
i) =25 [X28) - 5 (7 2:(8)) | +00). (19) 
i=1 
又 因为 


Z O ÊO r Zi(B)(AT Z:(8))? 
0= Lorka” 52o- A o+ Y Aor ; 
由 引 理 6-8 可 知 
X (AT Ê(8))? z; 
La IFAT ? 


从 而 


SATZ) = 30% (B)? + op), 


i=1 


= 
= (3540027 0) E 20) + oN»). 


i=1 i=l 
结合 (19) 式 ， 可 以 证 明 
a 1 1 N 5 T 1 1 1 1 a 
(8) = (N~#V-4 526) Vive Vi(N-3V 二》 Z,(8)) + o0). 
i=1 i=1 


根据 引 理 6 可 知 x 
Niv- Y Z,(8) 二 N(0, Tp). (20) 


i=l 
而 ViY 二 和 了 1 具有 相同 的 特征 值 ， 从 而 定理 1 得 证 。 
定理 2.2 的 证 明 回顾 ja(6) WEN, AS (19) 式 可 推 得 


N T N 
alB) = (N~# D 20) VO (NE E (8) + op(2). 
i=l i=1 


ZATIAN, MUE (8) > V(B)， 结 合 (20) RT MIEN balh) A EE A 
由 度 为 p 一 1 的 分布 。 
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Empirical Likelihood-based Inference for Single-index 
EV Models with Validation Data 


LIU Qiang’, XUE Liu-gen? 


(1- School of Statistics, Capital University of Economics and Business, Beijing 100070; 
2- College of Applied Sciences, Beijing University of Technology, Beijing 100124) 


Abstract: The single-index EV model is considered in this paper. When the explanatory variable is 
erroneously measured, especially the relationship between the surrogate variable and the explanatory 
one is unknown, the curse of dimension often appears in the estimation in the single-index model. In this 
paper, we propose a dimension reduction method, by which the above problem can be settled effectively. 
The empirical likelihood approach is used to construct the confidence regions of the parameter. Because 
a semiparametrc dimension reduction technique is employed in the estimation procedure, the results 
obtained in the paper can be used to deal with the dimension curse problem in the data processing in 
the fields such as biological engineering and network engineering, and has higher value of application. 
Keywords: single-index EV models; empirical likelihood; validation data; dimension reduction 
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